Loading...
机构名称:
¥ 1.0

由于空气的精致抗原特异性,个人的适应性免疫受体(空气)曲目记录了免疫病史。阅读此记录需要从序列中推断受体功能的计算方法,因为可能受体 - 抗原对的多样性大大超过了实验知识。鉴定具有相似序列的空气,因此在这些方法中是常见的性能瓶颈。在这里,我们基于基于半径的搜索Levenshtein邻居的五种不同算法方法的时间复杂性。我们表明,最初提出的用于拼写检查的对称删除查找方法特别可扩展。然后,我们引入Xtneighbor,这是该算法的一种变体,可以在GPU上大规模平行。对于一百万个输入序列,Xtneighbor识别了所有序列邻居,这些序列邻居在商品硬件上最多差异两个编辑,比现有方法快的数量级。我们还展示了对称删除查找如何使用更复杂的序列相似性指标(例如TCRDIST)加快搜索。我们的概述将大大加快现有分析管道的速度,并能够处理大规模的免疫测序数据而不会降采样。

arxiv:2403.09010v1 [q-bio.qm] 2024年3月14日

arxiv:2403.09010v1 [q-bio.qm] 2024年3月14日PDF文件第1页

arxiv:2403.09010v1 [q-bio.qm] 2024年3月14日PDF文件第2页

arxiv:2403.09010v1 [q-bio.qm] 2024年3月14日PDF文件第3页

arxiv:2403.09010v1 [q-bio.qm] 2024年3月14日PDF文件第4页

arxiv:2403.09010v1 [q-bio.qm] 2024年3月14日PDF文件第5页

相关文件推荐